home *** CD-ROM | disk | FTP | other *** search
/ Internet Info 1994 March / Internet Info CD-ROM (Walnut Creek) (March 1994).iso / inet / internet-drafts / draft-chon-korean-encoding-00.txt < prev    next >
Text File  |  1993-06-07  |  9KB  |  280 lines

  1.  
  2.  
  3. Network Working Group                                        Kilnam Chon
  4. Internet Draft                                              Hyun Je Park
  5.                                                             Uhhyung Choi
  6.                                                             May 11, 1993
  7.  
  8.  
  9.         Korean Character Encoding for Internet Messages
  10.  
  11.  
  12. Status of this Memo
  13.  
  14.    This document is an Internet Draft.  Internet Drafts are working
  15.    documents of the Internet Engineering Task Force (IETF), its Areas,
  16.    and its Working Groups. Note that other groups may also distribute
  17.    working documents as Internet Drafts.
  18.  
  19.    Internet Drafts are draft documents valid for a maximum of six
  20.    months. Internet Drafts may be updated, replaced, or obsoleted by
  21.    other documents at any time.  It is not appropriate to use Internet
  22.    Drafts as reference material or to cite them other than as a "working
  23.    draft" or "work in progress." 
  24.  
  25.    Please check the 1id-abstracts.txt listing contained in the
  26.    internet-drafts Shadow Directories on nic.ddn.mil, nnsc.nsf.net, 
  27.    nic.nordu.net, ftp.nisc.sri.com, or munnari.oz.au to learn the
  28.    current status of any Internet Draft.
  29.  
  30.    This draft document will be submitted to the RFC editor as an
  31.    informational document.  This document will expire before 2nd March
  32.    1993.  Distribution of this memo is unlimited. Comments are
  33.    solicited and should be sent to ietf-822@dimacs.rutgers.edu.
  34.  
  35.  
  36. Introduction
  37.  
  38.    This document describes the encoding method being used to represent
  39.    the Hangul, Korean character, in both header and body part of the
  40.    internet electronic mail system. This encoding method was specified
  41.    in System Development Network (SDN) in 1991, and has since then been
  42.    used, it has widely spread from SDN to other Korean IP networks.
  43.  
  44.    This document describes the name and encoding method of Hangul that
  45.    are to be used in order to match the message body format of MIME
  46.    [MIME] and the RFC1342 [RFC1342] header format.
  47.  
  48.    This document describes only the encoding method for plain text. 
  49.    Other text subtypes, rich text and similar forms of text, are beyond 
  50.    the scope of this document.
  51.  
  52.  
  53.  
  54. Chon et al              Expires November 11, 1993               [Page 1]
  55.  
  56. Internet Draft                                              May 11, 1993
  57.  
  58.  
  59. Description
  60.  
  61.    It is assumed that the starting code of the message is ASCII. ASCII
  62.    and Hangul can be distinguished by use of the shift function. For
  63.    example, the code SO will alert us that the up coming bytes will be 
  64.    either a Hangul character in 2 bytes or an ASCII space character in 
  65.    a single byte. To return to ASCII the SI code is used.
  66.  
  67.    Therefore, the escape sequence, shift function and character set used
  68.    in a Hangul message are as follows:
  69.  
  70.            SO           KSC 5601
  71.            SI           ASCII
  72.            ESC $ ) C    Appears in the first line of the message
  73.  
  74.    The KSC 5601 [KSC5601] character set that includes Hangul, Chinese
  75.    ideographic characters, graphic and foreign characters, etc. is two
  76.    bytes long for each character.
  77.  
  78.    For more information about Korean character codes please refer to the
  79.    KSC 5601-1989 document. Also, for more detailed information about the
  80.    escape sequence and the shift function you can look for the ISO 2022
  81.    [ISO2022] document.
  82.  
  83.  
  84. Formal Syntax
  85.  
  86.    Where this document in its formal syntax does not agree with the
  87.    description part, priority should be given to the formal syntax of
  88.    the document.
  89.  
  90.    The notations used in this section of the document are according to
  91.    those used in RFC822 [RFC822] with the same meaning.
  92.  
  93.         * (asterisk) has the following meaning :
  94.              l*m "anything"
  95.  
  96.    The above means that "anything" has to be used at least l times and
  97.    at most m times. Default values for l and m are 0 and infinitive,
  98.    respectively.
  99.  
  100.    body            = *e-line *1( designator *( e-line / h-line ))
  101.  
  102.    designator      = ESC "$" ")" "C"
  103.  
  104.    e-line          = *text CRLF
  105.  
  106.    h-line          = *text 1*( segment *text ) CRLF
  107.  
  108.  
  109.  
  110. Chon et al              Expires November 11, 1993               [Page 2]
  111.  
  112. Internet Draft                                              May 11, 1993
  113.  
  114.  
  115.    segment         = SO one-of-94 one-of-94
  116.                          *( *SP 1*(one-of-94 one-of-94)) SI
  117.  
  118.                                                ; ( Octal, Decimal.)
  119.  
  120.    ESC             = <ISO 2022 ESC, escape>    ; ( 33, 27.)
  121.  
  122.    SO              = <ASCII SO, shift out>     ; ( 16, 14.)
  123.  
  124.    SI              = <ASCII SI, shift in>      ; ( 17, 15.)
  125.  
  126.    SP              = <ASCII SP, space>         ; ( 40, 32.)
  127.  
  128.    one-of-94       = <any char in 94-char set> ; (41-176, 33.-126.)
  129.  
  130.    CHAR            = <any ASCII character>     ; ( 0-177, 0.-127.)
  131.  
  132.    text            = <any CHAR, including bare
  133.                       CR & bare LF, but NOT
  134.                       including CRLF>
  135.  
  136.  
  137. MIME and RFC1342 Considerations
  138.  
  139.    The name to be used for the Hangul encoding scheme in the contents is
  140.    "ISO-2022-KR". This name when used in MIME message form would be:
  141.  
  142.         Content-Type: text/plain; charset=iso-2022-kr
  143.  
  144.    Since the Hangul encoding is done with 7 bit format in nature, the
  145.    Content-Transfer-Encoding-header does not need to be used. However,
  146.    while using the Hangul encoding, current Hangul message softwares
  147.    does not support Base64 or Quoted-Printable encoding applied on 
  148.    already encoded Hangul messages.
  149.  
  150.    The Hangul encoded in the header part of the message is 8-bit EUC.
  151.    To use Hangul in the header part, according to the method proposed in
  152.    RFC1342, the encoded Hangul are "B" or "Q" encoded. When doing so,
  153.    the name to be used will be EUC-KR [EUC-KR].
  154.  
  155.  
  156. Background Information
  157.  
  158.    The Hangul encoding system is based on the ISO 2022 [ISO2022]
  159.    environment according to its 4/4 announcement. However, the Hangul
  160.    encoding does not include the announcement's escape sequence.
  161.  
  162.  
  163.  
  164.  
  165.  
  166. Chon et al              Expires November 11, 1993               [Page 3]
  167.  
  168. Internet Draft                                              May 11, 1993
  169.  
  170.  
  171.    The KSC 5601 used in this document is, in definition, identical to
  172.    the KSC 5601-1987, KSC 5601-1989 and KSC 5601-1992's 94x94 octet
  173.    definition.  Therefore, any revision that refers to KSC-5601 after
  174.    1992 is to be considered as having the same meaning.
  175.  
  176.    At present, the Hangul encoding system is based on the experience
  177.    acquired from the former widely used "N-Byte Hangul" among UNIX
  178.    users. Actually, the encoding method, "N-Byte Hangul", using SO and
  179.    SI was the encoding method used in SDN before KSC 5601 was made a
  180.    national standard.
  181.  
  182.    This code is intended to be used for the information interchange of
  183.    Hangul messages; any other use of the code is not considered apt.
  184.  
  185.  
  186. References
  187.  
  188.    [ASCII] American National Standards Institute, "Coded character set
  189.    -- 7-bit American national standard code for information
  190.    interchange", ANSI X3.4-1968
  191.  
  192.    [ISO2022] International Organization for Standardization (ISO),
  193.    "Information processing -- ISO 7-bit and 8-bit coded character sets
  194.    -- Code extension techniques", International Standard, 1986,
  195.    Ref. No. ISO 2022-1986 (E).
  196.  
  197.    [KSC5601] Korea Industrial Standards Association, "Code for
  198.    Information Interchange (Hangul and Hanja)," Korean Industrial
  199.    Standard, 1987, Ref. No. KS C 5601-1989.
  200.  
  201.    [EUC-KR] Korea Industrial Standards Association, "Hangul Unix
  202.    Environment," Korean Industrial Standard, 1992, Ref. No.
  203.    KS C 5861-1992.
  204.  
  205.    [RFC822] David H. Crocker, "Standard for the Format of ARPA Internet
  206.    Text Messages", Internet standard, August 1982, RFC822.
  207.  
  208.    [MIME] Nathaniel Borenstein and Ned Freed, "MIME (Multipurpose
  209.    Internet Mail Extensions): Mechanisms for Specifying and Describing
  210.    the Format of Internet Message Bodies", Proposed Internet standard,
  211.    June 1992, RFC1341.
  212.  
  213.    [RFC1342] K. Moore, "Representation of Non-ASCII Text in Internet
  214.    Message Headers", Proposed Internet standard, June 1992, RFC1342.
  215.  
  216.  
  217. Security Considerations
  218.  
  219.    This document does not include security considerations.
  220.  
  221.  
  222. Chon et al              Expires November 11, 1993               [Page 4]
  223.  
  224. Internet Draft                                              May 11, 1993
  225.  
  226.  
  227. Acknowledgments
  228.  
  229.    The authors wants to thank all the people who assisted in drafting
  230.    this document. In particular, we thank Erik von der Poel, Felix M. 
  231.    Villarreal, Ienup Sung, Kyoung Namgoong, and Kyuho Kim.
  232.  
  233.  
  234. Authors' Addresses
  235.  
  236.    Kilnam Chon
  237.    Korea Advanced Institute of Science and Technology
  238.    Department of Computer Science
  239.    Taejon, 305-701, Republic of Korea
  240.    
  241.    Tel: +82-42-869-3514
  242.    Fax: +82-42-869-3510
  243.  
  244.    Email: chon@cosmos.kaist.ac.kr
  245.  
  246.  
  247.    Hyun Je Park
  248.    Solvit Chosun Media, Inc.
  249.    748-16 Yeoksam-Dong, Kangnam-Gu
  250.    Seoul, 135-080, Republic of Korea
  251.  
  252.    Tel: +82-2-561-0361
  253.    Fax: +82-2-569-4847
  254.  
  255.    Email: hjpark@dino.media.co.kr
  256.  
  257.  
  258.    Uhhyung Choi
  259.    Korea Advanced Institute of Science and Technology
  260.    Department of Computer Science
  261.    Taejon, 305-701, Republic of Korea
  262.  
  263.    Tel: +82-42-869-3554
  264.    Fax: +82-42-869-3510
  265.  
  266.    Email: uhhyung@kaist.ac.kr
  267.  
  268.  
  269.  
  270.  
  271.  
  272.  
  273.  
  274.  
  275.  
  276.  
  277.  
  278. Chon et al              Expires November 11, 1993               [Page 5]
  279.  
  280.